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分 类 方法 是 采用 人 工 处 理 的 方式 依据 规则 对 数据 进行 
高 ， 且 在 一 定 程度 上 浪费 了 人 力 和 物力 。 随 着 技术 


这 对 研究 人 员 的 专业 性 要 求 较 
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不 足 、 大 规模 文本 数据 分 类 效果 较 
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型 包括 卷 积 神经 网 络 (Convolutional Neural Networks，CNN)、 循 环 神经 网 络 (Recurrent 
Neural Networks, RNN)、 长 短期 记忆 网 络 (Long-Short Term Memory RNN, LSTMO 和 门 控 
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理 能 力 。 但 是 聚 类 得 到 结果 可 解释 性 较 差 、 


Ne 


B44。 基于 划分 的 聚 类 方法 需要 事先 设 定 划分 的 聚 类 数 


F 划 分 、 层 次 、 密 度 、 网 格 、 模 型 的 聚 类 方法 


也 文本 更 具有 复杂 性 ， Wang, S ABU 
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稳定 性 较 低 ， 不 同 参数 设置 下 可 能 得 到 的 聚 类 
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成 的 ， 然 后 用 期 望 最 大 化 (Expectation Maximization,ZM) 或 吉 布 斯 采样 (Gibbs sampling) 


等 方法 估计 混合 模型 的 参数 ， 从 而 得 到 聚 类 结果 


中 主题 模型 诸如 概率 隐语 义 分 析 


(Probabilistic Latent Semantic Analysis, PLSA)， 和 潜在 狄 利克 雷 分 布 (Latent Dirichlet 
Allocation,LDA) 等 模型 是 对 文档 生成 过 程 进 行 建 模 的 概率 生成 模型 ， 能 够 发 现 文 档 中 的 洪 


在 主题 


在 意图 识别 任务 中 ，Jang J SAB HEH 


实现 对 话 系统 中 对 用 户 话 语 做 出 识别 ， 分 析 
据 ， 利 用 LDA, LSTM, SnowNLP 模型 对 


费 者 态度 理论 ， 分 析 消 费 者 心理 活动 ， 实 现 消费 者 意图 
本 提问 ， 使 用 词性 标注 和 命名 实体 识别 丰富 语义 特 生 


My 


上 了 一 种 基于 密度 的 词 嵌 入 特征 聚 类 方法 ， 能 够 
o Wang J 等 人 [基于 社交 媒体 评论 数 
评论 文本 进行 语义 识别 ， 解 构 情 感 - 行 为 - 认 知 消 
识别 。CaiR 等 人 9 基于 原始 医疗 文 
| DBSCAN 聚 类 方法 对 用 户 意 图 


长 


CLIQUE、STING 


对 数据 的 形状 和 密度 
较 敏 感 ， 需 要 手动 设 
置 参 数 ， 秘 的 边界 较 
模糊 难以 解释 


易于 实现 ， 有 效 处 理 大 规模 数据 ; A 
适应 调整 秘 的 数量 


概率 隐语 义 分 析 
(PLSAO 和 潜在 狄 利克 
雷 分 布 (LDA) 


FREI X IEEE 
模型 质量 较 差 


结果 用 概率 表示 ， 
结果 能 够 可 视 化 表示 


具有 可 解释 性 ; 


进行 分 类 识别 ， 以 了 解 用 户 的 真实 意图 。 
表 1 意图 识别 技术 归纳 
Er 具体 方法 存在 问题 优势 
SF ya ea. aa Ee Ty Saeed Seay te 
分 布 BI TRIAT 存在 大 量 语义 的 缺失 ”数据 的 问题 ， 在 一 定 程度 上 也 起 到 了 
上 下 不 i 扩充 特征 的 作用 
文 语 Word2Vec 通过 训练 得 到 的 词 向 量 可 以 
Sach) oe 连续 词 表 A —— LY 进行 向 量 运 算 ;，FastText 通过 使 用 字符 
有 识 Word2Vec. FastText 无 法 表征 词语 的 顺序 级 别 的 n-gram 特征 ， 对 于 复合 词 和 未 
ii 知 词 的 处 理 效果 更 好 
上 下 文 表 示 : 基于 LSTM 模型 参数 量 大 可 以 表示 词汇 表 以 外 的 词 ， 有 效 的 捕 
的 ELMo、GPT、BERT ^ 9E 获 词 的 语义 和 语法 
研究 人 员 的 专业 性 要 
KAE y 求 较 高 ， 且 在 一 定 程 ， 
分 类 度 上 浪费 了 人 力 和 物 
JJ 
gm K EMRE RIU 存在 语义 和 语序 信息 
文本 学习。 斯、 决策 树 、 支 持 向 量 处 理 不 足 、 大 规模 文 。 方 法 简单 易于 理解 
分 类 机 、 神 经 网 络 本 数据 分 类 效果 较 差 
方法 一 ERMA. HX ou qe 
深度 经 网 络 、 长 短期 记忆 网 AEA MEME RUE: 可 移植 性 高 ， 适 应 性 好 
一 络 和 门 控 循环 单元 E 
l 需要 消耗 天 量 资源 ， «aon o a 
迁移 cw taper 准确 率 高 ， 预 训练 模型 基础 上 微调 ， 
RY re maa 大 大 降低 训练 时 间 
XT 
X] 分 K-means 均值 算法 、K 中 对 噪声 点 敏感 ， 只 能 简单 快速 ， 当 艇 较为 密集 ， 呈 现 球状 
的 See 聚 目的 数据 集 或 团 状 能 有 较 好 的 效果 
类 
难以 处 理 大 规模 数 ” 适 用 于 发 现任 意 形 状 的 秘 ， 适 用 于 任 
ym BIRCHAICURE 算法 。 ” 据 ， 也 不 能 适应 动态 ” 意 形式 的 相似 度 或 距离 表示 形式 ， 取 
数据 集 的 处 理 。 类 粒度 的 灵活 性 
eqn d 对 两 不 参数 圈 的 半 
密度 Z. MESUR: SO “ 自 适 应 的 聚 类 ， 对 噪声 不 敏感 ， 能 发 
AA mm DEBNGUOPSXOBICS 集 越 大 、 花 费时 间 越 ” 现 任意 形状 的 入 
类 
基于 
网 格 
TES 
类 
基于 
模型 
TES 
类 


3. 舆情 意图 识别 应 用 领域 / Application of public opinion intention identification 
3.1 意见 领袖 研究 


在 与 论 扩 散 的 过 程 中 ， 意 见 领袖 发 挥 了 重要 作用 。 与 情意 图 识别 可 以 发 现 某 一 与 论 场 
中 的 意见 领袖 ， 帮 助 确定 哪些 主体 更 具 影响 力 。 这 部 分 的 研究 包括 意见 领袖 识别 、 意 见 领 
袖 影响 力 分 析 、 意 见 领 袖 引 导 机 理 分 析 。 

3.1.1 意见 领袖 识别 

在 意见 领袖 识别 方面 ， 研 究 者 多 采用 指标 构建 、 社 会 网 络 、 聚 类 分 析 及 其 相 结合 的 方 
法 识别 与 论 传播 过 程 的 核心 用 户 。 在 指标 构建 过 程 中 涉及 到 用 户 个 人 属性 、 用 户 行为 、 网 
络 结构 等 多 维度 ， 同 时 结合 关联 分 析 模 型 、 层 次 分 析 法 赋予 各 指标 以 不 同 权重 。 这 一 类 方 
法 易于 操作 ， 但 是 对 于 研究 人 员 的 专业 水 平 具有 一 定 的 依赖 性 。 如 吴江 等 四] 融合 社交 网 络 


] 户 个 人 属性 、 网 络 特征 、 行 为 特征 和 文本 特征 等 指标 构建 意见 领袖 评价 体系 ， 以 疫苗 事 
件 为 例 ， 借 助 聚 类 分 析 方 法 挖掘 该 事件 不 同 生命 周 期 阶段 的 意见 领袖 ， 应 用 社交 网 络 方法 
识别 意见 领袖 时 有 助 于 揭示 意见 领袖 之 间 的 相互 关系 和 信息 传播 路 径 ， 但 是 对 于 隐 性 社交 
网 络 和 小 规模 的 研究 场景 不 太 适 用 。 如 张 寒 阳 等 中 基于 社交 网 络 理论 ， 结 合 Doc2Vec 方法 
计算 内 容 相 似 度 、LDA 方 法 计算 主题 相似 度 、 基 于 DUTIR 情感 词典 计算 情感 相似 度 ， 综 合 
ER 3 个 指标 形成 文本 相似 度 ， 构 建 实时 动态 社会 网 络 ， 引 入 PageRank 算法 识别 社交 网 络 
中 起 到 关键 作用 的 重要 节点 ; 聚 类 分 析 方 法 可 以 识别 潜在 的 意见 领袖 ， 但 是 对 于 数据 的 要 
求 较 高 ， 因 此 经 常 配合 其 他 方法 同时 使 用 。 如 李 烟 辉 等 唤 综 合用 户 特征 、 交 互 特征 和 网 络 
结构 提出 MUR 〈Microblog-lyric User-Influence Rank)， 同 时 结合 K-means 算法 形成 MUK- 
means (Microblog-lyric User-Influence-based K-means) 算法 对 影响 力 较 大 的 用 户 进行 聚 类 ， 
识别 意见 领袖 群 。 

3.1.2 意见 领袖 影响 力 研究 

在 意见 领袖 影响 力 研究 方面 ， 现 有 研究 包括 对 意见 领袖 的 传播 影响 力 、 情 感 影响 力 、 
受 认 可 度 及 其 相 结合 等 方面 展开 分 析 。 在 传播 影响 力 研 究 中 ， 研 究 者 主要 基于 社会 网 络 理 
论 ， 关 注意 见 领袖 在 社交 网 络 中 的 核心 性 对 其 传播 影响 力 进行 分 析 。 如 万 钰 球 等 5 基于 社 
会 网 络 分 析 法 (SNA )， 采 用 网 络 密度 、 网 络 中 心性 、 凝 聚 子 群 3 个 维度 评估 意见 领袖 的 传 
播 影 响 力 。 在 情感 影响 力 研 究 中 ， 研 究 者 主要 通过 关注 意见 领袖 对 公众 情绪 、 态 度 、 行 为 
的 影响 程度 来 评估 其 影响 力 。 如 许 中 华 等 9 运用 PAD 模型 将 复杂 情感 划分 为 愉悦 度 、 唤 醒 
度 、 支 配 度 ， 同 时 结合 炉 权 法 量化 情感 指标 对 意见 领袖 实现 情感 影响 力 评估 ;， 在 受 认可 度 
研究 中 ， 研 究 者 通过 关注 意见 领袖 的 话语 权 、 社 会 认同 、 权 威 性 等 方面 展开 研究 。 如 如 王 
晰 强 等 "从 意见 领袖 受 认可 度 、 情 感 联系 度 、 网 络 传播 度 三 个 方面 构建 OLEI 指数 模型 评 
佑 意见 领 袖 的 影响 力 ， 并 以 “7.20 河南 暴雨 ”事件 为 例 对 提出 的 指数 模型 进行 验证 。 

3.1.3 意见 领袖 影响 力 机 制 研 究 

企 意 见 领袖 影响 机 制 研究 方面 ， 现 有 研究 包括 基于 意见 领袖 传播 的 基本 理论 进行 影响 
力 机 制 探析 ， 从 媒介 视角 对 意见 领袖 影响 力 的 生成 模式 进行 分 析 ， 以 及 从 用 户 视角 对 意见 
领袖 进行 访谈 。 如 人 徐 储 攻 3 发 现 主流 与 论 场 “ 意 见 领袖 ”的 影响 力主 要 体现 在 网 络 议程 设置 、 
网 络 市 民 和 传统 媒体 等 方面 。 如 任 婉 鸣 通过 对 大 学 生 进 行 无 结构 访谈 ， 通 过 扎根 理论 建立 
校园 与 情 传播 影响 机 制 模型 ， 发 现 线 下 权威 性 、 亲 密 感 和 线 上 活跃 度 是 促进 大 学 生意 见 领 
袖 影 响 力 的 因素 ， 议 程 设置 和 信息 干扰 是 大 学 生 对 网 络 舆 情 产 省 影响 的 主要 方式 ， 对 自我 
号 份 的 审视 和 对 利益 的 权衡 是 抑制 大 学 生意 见 领袖 表达 的 因素 。 如 靖 鸣 等 6 对 微 博 意见 领 
E, 
意 


袖 影 响 力 生成 模式 进行 分 析 ， 发 现 社会 属性 、 微 博 行动 以 及 普通 微 博 用 户 微 博 行动 是 影响 
意见 领袖 影响 力 的 重要 因素 。 

3.2 突 发 公共 事件 预警 
目前 ， 关 于 突 发 公共 与 情事 件 预警 的 方法 包括 基于 指标 体系 的 预警 方法 、 基 于 传播 过 


程 的 预警 方法 、 基 于 情感 的 预警 方法 。 
3.2.1 基于 指标 体系 的 预警 方法 
基于 指标 体系 


建 的 指标 体系 。 基 于 专家 打分 的 方法 包 提 
的 方法 较 依 赖 专家 的 主观 判断 ， 
而 基于 机 器 学 习 的 指标 构建 方法 能 够 有 效 提 高 结果 的 准确 


但 是 基于 专家 打分 
结果 的 不 稳定 性 。 
人 为 赋 权 的 主观 依赖 。 现 有 研究 包括 采 月 


的 预警 方法 包括 基于 专家 打分 构建 的 指标 体系 以 及 基于 机 器 学 习 方法 构 
层次 分 析 法 BU、 炳 权 法 


需要 较 多 的 专家 参与 ， 且 容易 导致 评估 


斯 网 络 等 方法 进行 指标 体系 构建 。 如 杨柳 等 54 采 
j 文 持 向 量 机 算法 构建 网 络 与 情 预 警 自动 识别 模型 。 如 张 璐 565 采 ) 
实时 分 析 人 处 理 ， 结 合 情 感 计生 


分 级 ， 最 后 采 / 


理 框架 SparkStreaming 实现 网 络 社区 文本 数据 流 上 


HARE XXI T. SCREIRI 


65、 网 络 分 析 法 55] 等 方法 ， 


性 ， 减少 了 对 
量 机 、Logistic 模型 、 


贝 叶 


灰色 关联 分 书 


方法 对 与 情 信 息 进行 分 类 


j 大 数据 处 


方法 分 析 


文本 情感 倾向 ， 识 别 文 本 的 与 情 类 别 并 得 到 与 情 预 警 等 级 。 如 彭 玲 59 基 于 Doc2vec 和 Bi- 


LSTM 1 


网 络 算法 建立 了 与 论 危 机 预警 模型 ， 并 对 模型 j 


经 网 络 以 及 注意 力 机 制 对 文本 的 情感 倾向 进行 了 分 析 ， 同 时 利用 


好 的 网 络 与 情 预 警 模 型 。Dandan 等 基于 


面 实现 对 网 络 与 情 的 预测 7 
3.2.2 基于 传播 过 程 的 预警 方法 
基于 传播 过 程 的 预警 方法 丰 


25r. A 


T BD d 


多 利 


传染 病 模型 (如 SI 模型 、SIR 模型 、 


Pr BEDA ed 


预测 与 情 变 化 ， 很 


外 性 和 


今 证 模型 有 效 性 。 


[6515 H] SIS FUEL ERE PEE 
体系 进行 自 
3.2.3 基于 情感 的 预警 方法 

在 基于 情感 的 预警 方法 研究 
的 正 、 负 
于 隐 含 情绪 、 复 杂 情 绪 的 识别 ; 


监控 预 


EMKA Rt 


pa 


"ug FEE Kk TBS i E823 


SIS 模型 等 ) 开展 研究 。 
特征 ， 构 建 演化 模型 ， 同 时 预测 1 
事件 的 预警 监测 。 但 是 该 方法 对 于 数据 的 准 
准确 预测 
征 ， 运 用 灰色 预测 方法 与 马 竹 


与 传染 病 


通 j 


HELIA LL, El 
通过 观察 与 情 传播 不 同 
下 一 阶段 的 舆情 发 展 趋势 ， 实 现 重 大 突 发 公共 
ED 实时 性 具有 较 高 要 求 ， 同 时 该 方法 仅 能 
与 情 发 展 情况 。 如 万 立 军 5! 等 通过 SIRS 模型 分 
可 夫 模 型 进行 趋势 预测 实现 风 
居 ， 利 用 SIR 传染 病 模型 与 EGM 
灰色 预测 模型 构建 政务 与 情 预 警 系 统 ， 动 态 监 测 与 情 信 息 以 及 时 实现 与 情 导 控 。 如 周 琦 萍 


险 预警 ， 


BP 和 Elman 神经 
行 不 断 调 试 、 验 证 、 比 较 ， 形 成 了 性 能 较 
神经 网 络 模型 构建 了 网 络 恤 情 预 警 机 制 ， 从 技术 方 


此 研究 者 


同时 基 


警 机 制 ， 并 引入 与 情 扩 散 系数 、 遗 忘 率 对 与 情 预 警 


适应 调整 ， 使 无 监督 预警 机 制 能 够 达到 最 优 状 态 。 


， 研 究 者 主要 通过 对 与 情 文 本 进行 情感 分 析 ， 判 断 与 情 
上 情感 倾向 ， 识 别 特定 敏感 词 ， 把 握 和 与 情 发 展 趋势 。 但 是 在 情感 识别 过 程 中 ， 对 
步 提 高 ， 并 且 情 感 分 析 依 赖 于 特定 领域 情感 


词典 的 建立 ， 不 同情 境 下 的 舆情 情感 识别 具有 差异 。 如 王 雪 狐 等 [590 基于 “郑州 交警 撞 死 婴 


儿 ” 突 发 事件 ， 对 公众 微 博 评论 的 情感 倾 


向 性 ; 


行 划分 ， 然 后 确定 预警 等 级 ， 并 对 相应 等 级 


采取 针对 性 引导 。 如 张 劲 松 等 @ 在 民族 关系 网 络 舆 情 特 征 的 基础 上 ， 对 网 络 舆 情 进行 文本 
倾向 性 分 析 ， 构 建 民族 与 情 预 警 监测 指标 体系 ， 提 上 H 


略 。 如 村 知 论 等 [5 在 评论 数据 基础 上 增加 绚 
BERT-RGRU 模型 和 “小 


感 倾向 ， 并 使 用 


疏 取 模块 、 预 处 理 模块 、 分 析 模 块 在 内 的 与 情 预警 模型 框架 。 


是 否 存在 负面 情绪 ， 并 对 负面 与 情 做 出 预警 。 


3.3 ELS TR SAR 
与 情意 


3.3.1 舆论 引导 及 控制 


在 与 论 引 导 及 控制 方面 ， 张 玉 强 [的 提出 通过 建立 和 完善 网 络 新 闻 


识别 能 够 有 效 帮 助 政府 了 解 公众 的 需求 ， 通 过 与 情意 图 
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Research status in the field of public opinion intention identification 

Yang Shuang, Wang Yan, Wang Yagqing, Liu Shuxia, Xu Meimei, An Xinying 
Institute of Medical Information, Chinese Academy of Medical Sciences, Beijing 100020 
Abstract: [Purpose/Significance] With the rapid development of social informatization, the spread 
scope and influence of online public opinions are constantly expanding. The analysis of public 
opinion intention is helpful for government departments to monitor and manage public opinion and 
create a healthy network environment. This study aims to sort out the development context and 
frontier trends in the field of public opinion intention recognition, provide direction for future 
research on public opinion intention recognition, and promote the development and application of 
the discipline. [Method/Process] This study discusses the current research status in the field of 
public opinion intention recognition, defines the concept and sources of public opinion intention 
recognition, and summarizes the technical methods, application fields, challenges and development 
directions of public opinion intention recognition. [Result/Conclusion] It is found that the current 
intention recognition of public opinion is mainly applied to the research of opinion leaders, early 
warning of public emergencies, public opinion governance and education. At the same time, the 
false information in online public opinion, the ambiguity of network language and the limited big 
data resources bring challenges to the recognition of public opinion intention. In the future, the 
process of public opinion intention recognition should focus on false information recognition, 
implicit information mining, algorithm and resource improvement. 
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